中国科学院地理科学与资源研究所,北京100101
摘  要:土壤水分是表达全球气候变化效应的关键陆面要素。为研发质量可靠的全球未来多情景地表土壤水分融合数据集,本研究首先利用改进的三重搭配(Enhanced Triple Collocation)对22套CMIP6(Coupled Model
Intercomparison Project Phase 6)土壤水分数据开展精度评价,获取随机误差标准差(Random Error
Standard Deviation,RESD)和相关系数(Correlation Coefficient,CC),选出参与融合的地球系统模式;其次,基于RESD和CC的归一化加权对筛选后的9套地球系统模式数据进行融合;最后,通过站点实测数据评价验证融合数据的精度。数据集内容包括:(1)基于SSP126、SSP245、SSP585情景预测的2015–2100年每月的土壤水分空间分布数据,空间分辨率为0.5°;(2)NAQU、REMEDHUS、SMOSMANIA、TWENTE四个站点的实测数据。数据集存储为.tif、.shp和.csv格式,由3,124个数据文件组成,数据量为829 MB(压缩为4个文件,770 MB)。
关键词:地表土壤水分;未来多情景;全球;融合
DOI: https://doi.org/10.3974/geodp.2025.02.03 
CSTR: https://cstr.escience.org.cn/
CSTR:20146.14.2025.02.03
数据可用性声明:
本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:
https://doi.org/10.3974/geodb.2024.11.10.V1或https://cstr.escience.org.cn/CSTR:20146.11.2024.11.10.V1.
土壤水分是指贮存在非饱和土壤带的水分含量,是表示土壤干湿程度的物理量。土壤水分是大气水、地表水、植物水和地下水转换的纽带,是物质传输的载体,在水循环和物质循环中发挥着不可或缺的作用[1–3]。同时,在人类活动排放温室气体导致的全球气候变暖的背景下,极端天气事件(如:高温热浪、洪涝、干旱)频发,高纬度高海拔地区永冻土消融退化,土壤水分时空分布格局发生显著变化,从而影响气候和生态系统的时空演变[4,5]。因此,获取全球范围、长时间序列、可靠的土壤水分数据对开展气候变化研判、水循环分析、植被生长监测、旱涝灾害预警、粮食安全保障等具有重要科学价值和战略意义[6–8]。
由世界气候研究计划耦合模拟工作组(World Climate Research Program’s Working Group on Coupled Modelling)发起的第六次国际耦合模式比较计划(Coupled Model Intercomparison Project Phase 6,CMIP6)为深刻理解未来气候变化提供了丰富的耦合气候模式[9,10]。CMIP6系列耦合气候模式现已成为联合国政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)编写第六次评估报告(Sixth Assessment Report,AR6)及联合国气候变化大会等气候变化谈判的重要参考依据[11]。围绕CMIP6构建了一系列刻画未来不同社会经济发展模式和大气温室气体浓度的情景,称为共享社会经济路径情景(Shared Socioeconomic Pathways,SSPs)。
为了增强数据的趋势代表性、降低异常偏差,以往研究通常简单计算多套未来情景数据的集合平均值表征全球未来土壤水分时空分布,但也面临被误差最大数据所主导的风险。此外,虽然地球系统模式(Earth System Models,ESM)持续历经优化迭代,当前仍存在系统性误差和不确定性[12]。此外,亟需以合理的多源信息互补和优化组合融合重构取代简单的集合平均计算,提高未来情景土壤水分的数据可靠性[13,14]。
本数据集是在评价多套CMIP6土壤水分的基础上,基于精度空间分布特征加权融合而来,能够为研究分析未来地表水循环时空演化格局提供科学数据支撑。
《多情景融合方法预测全球地表土壤水分实验数据集(2015–2100)》[15]的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1。
3.1  数据来源
本数据集中所采用的CMIP6地表(0–10 cm)土壤水分数据[11]主要包括3种共享社会经济路径,即SSP1-2.6(可持续路径)、SSP2-4.5(中等路径)、SSP5-8.5(化石燃料燃烧路径)。参与评价及融合的土壤水分数据源自22种地球系统模式,即ACCESS-CM2 (澳大利亚联邦科学与工业研究组织和澳大利亚气象局)、BCC-CSM2-MR(国家(北京)气候中心)、CAMS-CSM1-0(中国气象科学研究院)、CanESM5-CanOE(加拿大地球系统模式)、CESM2(通用地球系统模式)、CMCC-CM2-SR5(欧洲地中海气候变化中心耦合气候模式)、CMCC-ESM2(欧洲地中海气候变化中心地球系统模式)、CNRM-CM6-1(国家气象研究中心耦合气候模式)、CNRM-CM6-1-HR(国家气象研究中心高分辨率耦合气候模式)、CNRM-ESM2-1(国家气象研究中心地球系统模式)、EC-Earth3-Veg-LR(欧盟低分辨率地球系统模式)、GFDL-ESM4(美国地球物理学实验室地球系统模式)、IPSL-CM6A-LR(皮埃尔-西蒙拉普拉斯研究所低分辨率气候模式)、KACE-1-0-G(韩国气象厅改进型集合地球系统)、MIROC6(跨学科气候研究模式)、MIROC-ES2L(适用于
表1  《多情景融合方法预测全球地表土壤水分实验数据集(2015–2100)》元数据简表
| 条 
  目 | 描 
  述 | 
| 数据集名称 | 多情景融合方法预测全球地表土壤水分实验数据集(2015–2100) | 
| 数据集短名 | MonthlyinsituData | 
| 作者信息 | 杨芬,中国科学院地理科学与资源研究所,yangf@igsnrr.ac.cn 刘杨晓月,中国科学院地理科学与资源研究所,lyxy@lreis.ac.cn | 
| 地理区域 | 全球(90°N–60°S) | 
| 数据年代 | 2015–2100年 | 
| 时间分辨率 | 月 | 
| 空间分辨率 | 0.5°×0.5° | 
| 数据格式 | .tif、.shp和.csv | 
| 数据量 | 约770 MB(压缩后) | 
| 数据集组成 | (1)基于SSP126、SSP245、SSP585情景预测的2015–2100年每月的土壤水分空间分布数据;(2)NAQU、REMEDHUS、SMOSMANIA、TWENTE四个站点的实测数据 | 
| 基金项目 | 国家自然科学基金(42101475) | 
| 数据计算环境 | Python 3.8.8 | 
| 出版与共享服务平台 | 全球变化科学研究数据出版系统 http://www.geodoi.ac.cn | 
| 地址 | 北京市朝阳区大屯路甲11号100101,中国科学院地理科学与资源研究所 | 
| 数据共享政策 | (1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[16] | 
| 数据和论文检索系统 | DOI,CSTR,Crossref,DCI,CSCD,CNKI,SciEngine,WDS,GEOSS,PubScholar,CKRSC | 
长期模拟的气候与地球系统跨学科研究模式)、MPI-ESM1-2-LR(马普气象研究所低分辨率地球系统模式)、MRI-ESM2-0(马普气象研究所地球系统模式)、NorESM2-LM(低分辨率挪威地球系统模式)、NorESM2-MM(中分辨率挪威地球系统模式)、TaiESM1(台湾地球系统模式)、UKESM1-0-LL(低分辨率英国地球系统模式)。
此外,本研究使用SMAP(Soil Moisture Active Passive)土壤水分数据[17]、ERA5-Land(Medium-Range Weather Forecast Reanalysis v5-Land)地表土壤水分数据[18]和全球土壤水分监测网络实测数据[19]作为辅助数据开展评价验证。
3.2 技术路线
本研究旨在获取稳定可靠的CMIP6土壤水分融合数据产品。首先,将所有栅格数据转换为TIF格式,空间分辨率统一至0.5°×0.5°,时间分辨率统一至月尺度;第二,运用ETC方法(Enhanced Triple Collocation),利用SMAP、ERA5-Land土壤水分数据对CMIP6土壤水分数据进行质量评价,获取随机误差标准差(RESD)和相关系数(CC);第三,基于质量评价结果筛选出精度较好的CMIP6地球系统模式数据,结合各数据的精度空间分布计算加和归一化权重,依据加和归一化权重进行融合;第四,通过地面实测数据验证评价融合数据的精度水平,选取偏差(Bias)、均方根误差(RMSE)和拟合优度(R)作为误差参数来系统验证融合数据的精度,同时,计算简单加权平均融合数据的评价验证结果作为参考。具体数据研制流程如图1所示。

图1  土壤水分产品融合算法流程图
如表2所示,首先计算得出各地球系统模式土壤水分数据评价均值,筛选出RESD较小的ACCESS-CM2、IPSL-CM6A-LR、MIROC-ES2L、MPI-ESM1-2-LR、TaiESM1及CC较高的CanESM5-CanOE、CMCC-CM2-SR5、CNRM-CM6-1-HR、KACE-1-0-G共计9套地球系统模式土壤水分数据参与融合。
4.1 数据集组成
数据集内容包括:(1)基于SSP1-2.6、SSP2-4.5、SSP5-8.5情景预测的2015–2100年每月的土壤水分空间分布数据,空间分辨率为0.5°,数据单位为m3/m3,数据取值范围是0到1,文件命名方式为SSP***_yyyy-mm.tif;(2)NAQU、REMEDHUS、SMOSMANIA、TWENTE四个站点的实测数据。数据集存储为.tif、.shp和.csv格式,由3,124个数据文件组成,数据量为829 MB(压缩为4个文件,770 MB)。
表2  各地球系统模式土壤水分数据评价均值
| 地球系统模式 | RESD(m3/m3) | CC | 地球系统模式 | RESD(m3/m3) | CC | 
| ACCESS-CM2 | 0.026 | 0.465 | GFDL-ESM4 | 0.032 | 0.479 | 
| BCC-CSM2-MR | 0.030 | 0.457 | IPSL-CM6A-LR | 0.026 | 0.486 | 
| CAMS-CSM1-0 | 0.033 | 0.460 | KACE-1-0-G | 0.069 | 0.515 | 
| CanESM5-CanOE | 0.048 | 0.501 | MIROC-ES2L | 0.029 | 0.473 | 
| CESM2 | 0.048 | 0.495 | MIROC6 | 0.030 | 0.486 | 
| CMCC-CM2-SR5 | 0.044 | 0.523 | MPI-ESM1-2-LR | 0.026 | 0.458 | 
| CMCC-ESM2 | 0.044 | 0.524 | MRI-ESM2-0 | 0.036 | 0.479 | 
| CNRM-CM6-1 | 0.036 | 0.499 | NorESM2-LM | 0.047 | 0.491 | 
| CNRM-CM6-1-HR | 0.036 | 0.501 | NorESM2-MM | 0.047 | 0.498 | 
| CNRM-ESM2-1 | 0.036 | 0.503 | TaiESM1 | 0.030 | 0.499 | 
| EC-Earth3-Veg-LR | 0.046 | 0.470 | UKESM1-0-LL | 0.039 | 0.494 | 
4.2 数据结果
图2为融合后的CMIP6在SSP1-2.6、SSP2-4.5、SSP5-8.5三种共享社会经济路径模式下的土壤水分数据,以2030年1月、4月、7月、10月的数据作为CMIP6土壤水分融合产品在冬、春、夏、秋4个季节的样例。由图可知,CMIP6融合土壤水分的时空分布格局特征与气候季相节律周期较为一致。数据在融合过程中利用水体掩膜数据将河流、湖泊、冰川等陆域水体剔除,保障数据的合理性。
4.3 数据结果验证
为了定量化评价CMIP6土壤水分融合数据的精度,本研究选取并收集了4个具有长期监测能力的地面土壤水分监测网络数据,包括NAQU(位于青藏高原那曲地区)、REMEDHUS(位于西班牙)、SMOSMANIA(位于法国)和TEWNTE(位于荷兰),对2015–2024年期间的融合数据进行评价验证。鉴于地面站点实测数据多提供小时级的地表土壤水分数据,因此将小时级数据首先合成日尺度数据,再合成月尺度数据。为保障数据质量、稳定性和代表性,设定一天有不少于12个小时的监测数据方可加权计算日尺度数据,一个月有不少于15天的监测数据方可加权计算月尺度数据。同时,计算22套CMIP6土壤水分数据加权平均值作为对照参考。
如表3所示,CMIP6土壤水分融合数据在数值精度(Bias和RMSE)方面相较于加权平均数据具有显著优势,揭示了基于ETC精度空间分布数据归一化融合带来的精度提升效果。CMIP6土壤水分融合数据在拟合优度方面与加权平均数据精度相当,能够合理刻画地表土壤水分时空分布纹理特征,较好地拟合地面实测土壤水分值。

图2 
SSP1-2.6、SSP2-4.5、SSP5-8.5模式下的土壤水分融合数据
(以2030年1月、4月、7月、10月为例)
表3  CMIP6土壤水分融合数据精度评价结果
| 土壤水分监测网 | 评价指标 | 融合数据 | 加权平均数据 | ||||
| SSP1-2.6 | SSP2-4.5 | SSP5-8.5 | SSP1-2.6 | SSP2-4.5 | SSP5-8.5 | ||
| NAQU | Bias (m3/m3) | 0.043 | 0.042 | 0.040 | 0.081 | 0.087 | 0.083 | 
| RMSE (m3/m3) | 0.055 | 0.055 | 0.054 | 0.091 | 0.096 | 0.092 | |
| R | 0.779 | 0.766 | 0.757 | 0.685 | 0.703 | 0.737 | |
| REMEDUHS | Bias (m3/m3) | 0.107 | 0.107 | 0.104 | 0.140 | 0.138 | 0.136 | 
| RMSE (m3/m3) | 0.117 | 0.119 | 0.116 | 0.147 | 0.146 | 0.145 | |
| R | 0.747 | 0.708 | 0.710 | 0.731 | 0.714 | 0.712 | |
| SMOSMANIA | Bias (m3/m3) | 0.032 | 0.029 | 0.027 | 0.054 | 0.051 | 0.050 | 
| RMSE (m3/m3) | 0.084 | 0.084 | 0.083 | 0.092 | 0.092 | 0.091 | |
| R | 0.681 | 0.682 | 0.673 | 0.696 | 0.679 | 0.688 | |
| TWENTE | Bias (m3/m3) | 0.168 | 0.163 | 0.169 | 0.214 | 0.211 | 0.214 | 
| RMSE (m3/m3) | 0.174 | 0.170 | 0.176 | 0.218 | 0.215 | 0.218 | |
| R | 0.587 | 0.593 | 0.545 | 0.570 | 0.602 | 0.561 | |
土壤水分是地表水循环系统中具有重要意义的组成部分,获取长时序、质量可靠的全球土壤水分数据对于理解水循环格局具有关键支撑作用。在全球气候变化背景下,获取质量可靠的未来情景土壤水分数据是准确研判探索水资源时空分布演化特征的必备条件。本研究从数据融合的角度出发,在ETC评价的基础上,将多套CMIP6未来土壤水分数据与相应的精度空间分布数据归一加权融合,最终形成2015–2100年全球月尺度0.5°×0.5°分辨率地表土壤水分数据集。经站点实测数据验证,融合数据在偏差和均方根误差取值方面相较于简单加权平均数据明显降低,表明融合数据能够有效提升精度和可靠性。
本数据集作为全球地表未来土壤水分数据集,可为研究气候变化、生态风险和深入认识土壤水分时空演化提供参考依据,为揭示地表土壤水分的迁移模拟提供科学数据基础,为地表水资源非均衡分布演化和应对、可持续发展提供辅助决策支撑。
 
作者分工:杨芬对数据集的开发做了总体设计,并采集和处理了所有数据;刘杨晓月撰写了数据论文。
利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。
[1] 周成虎, 于静洁. 中国水文地理研究的回顾与展望[J]. 地理学报, 2023, 78(7): 1659–1665.
[2] 刘杨晓月, 杨雅萍. 多源微波遥感融合大尺度区域土壤水分数据集研究进展综述[J]. 数据与计算发展前沿, 2023, 4(6): 24–33.
[3] 潘宁, 王帅, 刘焱序等. 土壤水分遥感反演研究进展[J]. 生态学报, 2019, 39(13): 4615–4626.
[4] 谢正辉, 陈思, 秦佩华等. 人类用水活动的气候反馈及其对陆地水循环的影响研究——进展与挑战[J]. 地球科学进展, 2019, 34(8): 801–813.
[5] 刘昌明, 刘小莽. 从地球系统圈层互馈与地理综合角度探讨水循环研究[J]. 地理学报, 2023, 78(7): 1593–1598.
[6] 李震, 郭华东, 施建成. 综合主动和被动微波数据监测土壤水分变化[J]. 遥感学报, 2002, 6(6): 481–484.
[7] 马柱国, 符淙斌, 谢力等. 土壤湿度和气候变化关系研究中的某些问题[J]. 地球科学进展, 2001, 16(4): 563–568.
[8] Liu, Y. X. Y., Yang, Y. P., Song, J. Variations in global soil moisture during the past decades: climate or human causes? [J]. Water Resources Research, 2023, 59(7): e2023WR034915.
[9] 周天军, 邹立维, 陈晓龙. 第六次国际耦合模式比较计划(CMIP6)评述[J]. 气候变化研究进展, 2019, 15(5): 445–456.
[10] 王一诺, 乔梁, 左志燕. CMIP6 陆面、雪和土壤湿度模式比较计划(LS3MIP)评述[J]. 气候变化研究进展, 2022, 18(6): 795–800.
[11] 姜大膀, 王娜. IPCC AR6报告解读:水循环变化[J]. 气候变化研究进展, 2021, 17(6): 699–704.
[12] Liu, Y. X. Y., Chen, X. N., Bai, Y. Q., et al. Evaluation of 22 CMIP6 model-derived global soil moisture products of different shared socioeconomic pathways [J]. Journal of Hydrology, 2024, 636: 131241.
[13] Li, Z. L., Leng, P., Zhou, C. H., et al. Soil moisture retrieval from remote sensing measurements: current knowledge and directions for the future [J]. Earth-Science Reviews, 2021, 218(1): 1–24.
[14] Qiao, L., Zuo, Z. Y., Xiao, D. Evaluation of soil moisture in CMIP6 simulations [J]. Journal of Climate, 2022, 35(2): 779–800.
[15] 杨芬, 刘杨晓月. 多情景融合方法预测全球地表土壤水分实验数据集(2015–2100)[J/DB/OL]. 全球变化数据仓储电子杂志, 2024. https://doi.org/10.3974/geodb.2024.11.10.V1. https://cstr.escience.org.cn/ CSTR:20146.11.2024.11.10.V1.
[16] 全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. DOI: 10.3974/dp.policy. 2014.05 (2017年更新).
[17] Spencer, M., Wheeler, K., White, C., et al. The Soil Moisture Active Passive (SMAP) mission L-Band radar/radiometer instrument [J]. IEEE, 2010: 3240–3243.
[18] Muñoz-Sabater, J., Dutra, E., Agustí-Panareda, A., et al. ERA5-Land: a state-of-the-art global reanalysis dataset for land applications [J]. Earth System Science Data, 2021, 13(9): 4349–4383.
[19] Dorigo, W. A., Wagner, W., Hohensinn, R., et al. The International Soil Moisture Network: a data hosting facility for global in situ soil moisture measurements [J]. Hydrology and Earth System Sciences, 2011, 15(5): 1675–1698.